时政
财经
科技
虚拟货币
其他
登录
#World Model
关注
𝙩𝙮≃𝙛{𝕩}^A𝕀²·ℙarad𝕚g𝕞
1周前
三者的共同问题是:潜空间的几何应该是什么形状?JEPA 用”物理可预测性”来约束它,Friston 用”感觉原因的层级结构”来约束它,LLM 用”语言统计结构”来约束它。 这篇论文暗示的方向是:一个真正的 world model,需要找到一个同时被物理定律约束(不变量来自 PDE 和守恒律)和被语言结构约束(符号可操作性来自人类概念体系)的潜空间。 这个潜空间里的表征,应该既能预测下一个物理状态,又能被自然语言描述和查询——因为它同时捕捉了物理世界的时空结构和人类理解这个结构的概念组织。 这不是今天的技术能做到的。但这篇论文里 JEPA 在物理参数估计上的优势,是朝这个方向迈出的一小步——证明了潜空间预测比像素预测更接近物理世界的生成结构,而物理世界的生成结构,正是任何真正的 world model 必须学会的语言。
#潜空间
#物理可预测性
#感觉原因的层级结构
#语言统计结构
#World Model
#物理定律
#语言结构
#表征能力
分享
评论 0
0
勃勃OC
4个月前
今天谷歌发布Gemini 3,有一个小细节不知道大家注意到没有 劈柴说AGI实现还需要5-10年,我认为这个估计是可信的。 Google这次花了大力气去做finetune,模型的测试是最全面的。 事实证明,基于LLM的基础模型训练可能已经到头了。他们认为需要新的模型突破来处理World Model和逻辑 如果真的理解劈柴的这句话,未来5年AI的投资思路都得变 当然不变的是,一定是只有极少数聪明人才能看懂并且执行 绝大部分散户只是人云亦云的跟风机器。。
Google Gemini 2.5发布引发AI模型性价比热议· 475 条信息
OpenAI新德里发布会:ChatGPT语音翻译功能引发热议· 869 条信息
#Gemini 3
#AGI
#LLM
#World Model
#AI投资
分享
评论 0
0
indigo
7个月前
World Model 可以把任何畫面都變成 AR / VR!感覺 Genie 3 和 Apple Vision Pro 才是天生一對😅 "The Death of Socrates" by Jacques Louis David's
AI视频井喷:Midjourney领跑,多模态混战· 337 条信息
#World Model
#AR/VR
#Genie 3
#Apple Vision Pro
#Jacques Louis David
分享
评论 0
0
个人主页
通知
我的投稿
我的关注
我的拉黑
我的评论
我的点赞